GWUM : une généralisation des pages Web guidée par les usages

نویسندگان

  • Doru Tanasa
  • Florent Masseglia
  • Brigitte Trousse
چکیده

The usage analysis of a Web site based on the extracted sequential patterns is often limited by the low support of these patterns. That is mainly due to the great diversity of the pages and behaviors. However, it is possible to group the majority of these pages in various categories during a preprocessing. Then, using these categories, rather than the URL, will allow us to discover "generic" behaviors. This article presents a methodology for Web usage mining that uses such a generalization of the URL. This generalization is based on a categorization of the URL using the information extracted from the Web users’ accesses to these pages. Then, we present an experiment which shows how the support of the extracted sequential patterns changes according to whether the patterns are obtained with or without this generalization. MOTS-CLÉS : Fouille des usage du Web, motifs séquentiels, classification

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Approche Guidée par les Structures Hiérarchiques Spatiales pour la Généralisation à la Volée dans SOLAP

RÉSUMÉ. La généralisation à la volée désigne l’utilisation de techniques de généralisation automatique en temps réel. Les données générées sont temporaires et exclusivement destinées à la visualisation et non pas au stockage ou à d’autres fins. Ceci, rend ce processus bien adapté aux contextes hautement interactifs tels que la cartographie en ligne et le SOLAP. BLG tree et GAP tree sont des str...

متن کامل

Classification Conceptuelle avec Généralisation par Intervalles

Résumé. Nous nous intéressons aux méthodes de classification hiérarchique ou pyramidale, où chaque classe formée correspond à un concept, i.e. une paire (extension, intension), considérant des données décrites par des variables quantitatives à valeurs réelles ou intervalles, ordinales et/ou prenant la forme de distribution de probabilités/fréquences sur un ensemble de catégories. Les concepts s...

متن کامل

Analyse des rôles dans les communautés virtuelles : définitions et premières expérimentations sur IMDb

RESUME. Analyser les rôles dans les communautés virtuelles nous permet de mieux comprendre, voire de prédire, le comportement individuel des internautes. Bien que de nombreuses approches aient été proposées, on constate un manque de généralisation des méthodes existantes et des résultats obtenus. Dans ce papier, nous passons en revue quelques théories développées à propos des rôles sociaux et n...

متن کامل

Approche guidée pour l'anonymisation de bases de données

RESUME. L’anonymisation des données personnelles requiert l’utilisation d’algorithmes complexes permettant de minimiser le risque de ré-identification tout en préservant l’utilité des données. Dans cet article, nous décrivons une approche fondée sur les modèles qui guide le propriétaire des données dans son processus d’anonymisation. Le guidage peut être informatif ou suggestif. Il permet de ch...

متن کامل

Interprétation d'images basée sur une approche évolutive guidée par une ontologie

Résumé. Les approches de fouille et d’interprétation d’images consistant à considérer les pixels de façon indépendante ont montré leurs limites pour l’analyse d’images complexes. Pour résoudre ce problème, de nouvelles méthodes s’appuient sur une segmentation préalable de l’image qui consiste en une agrégation des pixels connexes afin de former des régions homogènes au sens d’un certain critère...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2006